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一 种 基于 偏 移 寻 址 的 存储 高 效 IP 地 址 查找 算法 


RE Wak FAK 刘 向 阳 


摘要 网 络 带 宽 的 迅猛 增长 、 虚 拟 路 由 器 和 软件 路 由 器 等 新 兴 技 术 的 涌现 ， 迫 切 需 要 存储 高 效 IP 地 址 查找 
算法 ,已 有 的 实际 他 地 址 查找 算法 是 基于 多 义 特 里 树 的 空间 高 效 编码 ,例如 树 位 图 特 里 树 (Tree Bitmap Trie)。 
但 在 这 些 编码 方法 中 ， 每 个 节点 维护 多 个 指针 以 及 多 个 关联 的 位 图 ， 导 致 特 里 树 的 存储 空间 开销 大 ， 难 以 
将 信息 存储 在 高 速 片上 存储 器 中 ， 从 而 限制 了 IP 查找 性 能 。 本 文 提 出 了 一 种 新 颖 的 偏 移 编码 特 里 树 (Offset 
Encoded Trie, OET)， 实 现存 储 高 效 IP 地 址 查找 。 偏 移 编码 特 里 树 的 每 个 节点 仅 维护 1 个 下 一 跳 步 位 图 和 1 
个 偏 移 值 ， 而 不 需要 孩子 指针 和 下 一 跳 步 指针 。 每 个 节点 利用 下 一 跳 步 位 图 和 偏 移 值 计算 出 下 一 搜索 节点 
的 存储 地 址 。 在 IP 地 址 查找 过 程 中 ， 片 上 偏 移 编码 特 里 树 查 找 出 最 长 匹配 前 缀 ， 而 片 外 前 绥 哈 希 表 查 找 出 
与 该 前 级 想 关 联 的 下 一 跳 步 信息 。 本 文采 用 实际 IP 前 级 规则 集 进行 了 实验 评估 ， 实 验 结果 表明 : 与 已 有 多 
™ 又 特 里 树 编码 方法 相 比 ， 偏 移 编码 特 里 树 显 著 减 少 了 存储 空间 开销 。 


= 关键 词 ， 路 由 器 IP 地 址 查找 最 长 前 级 匹配 特 里 树 


Tli} 
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IP HAEA FRE ARR AA O, EL RA ie KH AL HC (Longest Prefix Matching). 

a 即 在 IP 前 绥 规 则 集中 ， 查 找 与 数据 包 的 目的 卫 EAR TR, PER 
os 器 中 , IP 前 绥 规 则 集 包含 百 万 多 条 规则 ， 且 每 条 IP 前 级 规则 是 由 P 地 址 前 级 及 其 关联 的 下 
= 一 跳 步 (Next Hop) 信 息 构成 。 其 中 下 一 跳 步 信息 包括 转发 端口 、 转 发 路 由 器 MAC 地 址 等 。 
< IP 路 由 器 可 运行 在 静态 或 动态 模式 下。 在 静态 模式 中 ， 路 由 器 采用 离线 方式 周期 性 更 新 IP 
前 级 规则 集 ， 适 合 快 速 IP 查找 ; 在 动态 模式 中 ， 路 由 器 采用 在 线 方式 实时 更 新 IP 前 级 规则 

r= 集 ， 可 能 中 断 IP 查找 。 凯 撒 (M，Caesar) 等 人 中 指出 ， 对 IP 前 级 规则 集 的 动态 更 新 策略 导致 
rr 路 由 性 能 降低 。 因 此 ， 本 文章 点 研究 静态 IP 地 址 查找 算法 ， 支 持 离线 更 新 操作 ， 实 现 快 速 


随 着 网 络 带宽 和 业务 流量 的 迅 独 增长，IP 地 址 查找 算法 面临 可 扩展 性 挑战 ， 即 如 何 满 

足 高 速 数据 包 处 理 的 吞吐 量 和 空间 需求 。IP 地 址 查找 是 计算 密集 型 操作 ， 运 行 在 路 由 器 的 

关键 数据 路 径 ， 已 成 为 路 由 器 的 性 能 瓶颈 。 近 年 来 ， 日 新 月 异 的 网 络 技术 及 其 应 用 迫切 需要 
存储 高 效 TP 地 址 查找 算法 。 这 是 因为 : 

-互联 网 的 骨干 链 路 带宽 从 40Gbps 增 至 100GbpsB4， 这 要 求 降低 IP 地 址 查找 算法 

的 存储 空间 需求 ， 从 而 实现 线 速 IP 查找 。 

— IP 前 级 规则 集 随 网 络 规 模 叶 指数 级 增长 ,例如 当前 的 核心 路 由 器 已 包含 约 31 万 条 

IP 前 级 规则 外， 为 了 实现 在 片上 存储 器 上 存储 并 查找 整个 IP 前 级 规则 集 必须 压缩 

IP 地 址 查找 算法 的 转发 数据 结构 。 

— 日益 普及 的 虚拟 路 由 器 技术 是 一 种 支持 可 编程 的 新 兴 网 络 技术 , 即 在 单个 物理 硬件 


1 Media Access Controller， 媒 体 存储 控制 器 
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一 种 基于 偏 移 寻 址 的 存储 高 效 IP 地 址 查找 算法 


Bi cre A ggg in 爱 规 则 表 。 
可 扩展 虚拟 路 由 器 要 求 使 每 个 虚拟 路 由 器 的 存储 空间 开销 最 小 化 , 从 而 支持 更 多 的 
并 发 虚拟 路 由 器 。 
一 ”业界 广泛 使 用 的 软件 路 由 器 技术 是 利用 多 核 处 理 器 平台 的 强大 并 行 计算 能 力 ,采用 

软件 方式 设计 与 实现 高 速 路 由 器 。 高 性 能 软件 路 由 器 要 求 在 片上 高 速 缓存 中 存储 与 
查找 整个 IP 前 级 规则 集 ， 加 速 多 核 处 理 器 的 IP 查找 。 因 此 ， 促 使 研究 者 重新 关注 
IP 地 址 查找 算法 的 紧凑 型 转发 数据 结构 ， 以 实现 快速 和 可 扩展 IP 查找 。 


IP 地 址 查找 算法 可 分 为 基于 TCAM”、 基 于 哈 希 和 基于 特 里 树 (Trie)。 基 于 TCAM 的 算 
法 上 2 可 提供 确定 性 和 高 速 P 查找 ， 但 是 存在 开销 高 和 能 耗 高 等 缺点 。 基 于 哈 希 的 算法 
49 利用 哈 希 表 加 速 P 查找 性 能 ， 但 是 存在 存储 器 带宽 需求 大 等 缺点 。 由 于 特 里 树 是 一 种 
高 效 数 据 结 构 ， 基 于 特 里 树 的 算法 下 2 广泛 应 用 于 高 速 路 由 器 、 防 火 墙 和 NIDS/NIPS3 等 。 
当前 的 虚拟 路 由 器 和 软件 路 由 器 主要 采用 基于 特 里 树 的 高 效 卫 地 址 查找 算法 ， 满 足 其 可 扩 
展 性 和 可 编程 性 等 需求 。 


但 是 , 已 有 的 基于 特 里 树 的 IP 地 址 查找 算法 0923 仍 存 
在 存储 空间 开销 大 等 问题 。IP 地 址 查找 算法 通常 采用 多 又 
特 里 树 表 示 一 组 IP 前 级 规则 ， 即 一 次 检查 IP 地 址 的 多 个 
比特 ， 以 增加 存储 空间 开销 为 代价 来 提高 其 知 叶 量 。 许 多 
实际 全 地 址 查找 算法 是 采用 多 又 特 里 树 的 空间 高 效 编码 方 
法 , 例如 树 位 图 特 里 树 (Tree Bitmap Trie)”, AT m Eyo 
此 存储 空间 需求 。 在 这 些 编码 方法 中 ， 特 里 树 的 每 个 节点 
维护 孩子 指针 、 下 一 跳 步 指针 以 及 关联 的 位 图 (Bitmap)。 1% 图 1. 二 又 特 里 树 
子 指针 指向 孩子 节点 ， 其 大 小 为 log;n 比特 ， 而 下 一 跳 步 指针 指向 下 一 跳 步 信息 ， 其 大 小 为 
log,m 比特 ;位 图 的 大 小 为 0(25) 比特 ， 其 中 n 表示 节点 个 数 ，m 表示 下 一 跳 步 信息 个 数 ， 
s 表示 步 长 的 比特 个 数 。 由 于 n 和 m 随 着 前 级 规则 条 数 的 增加 而 增加 , 节点 的 孩子 指针 和 
一 跳 步 指针 占用 更 多 存储 空间 ， 导 致 这 些 特 里 树 编码 方法 的 可 扩展 性 差 。 例 如 ， 树 位 图 
树 的 每 个 节点 维护 1 个 外 部 位 图 及 1 个 孩子 指针 、1 个 内 部 位 图 及 1 个 下 一 跳 步 指针 ， 假设 
IP 前 缀 规则 集 包含 310K 条 IP 前 级 规则 ,二叉树 位 图 特 里 树 包 含 219K 个 节点 ; 整个 树 位 图 
特 里 树 占用 15Mb 的 存储 空间 ， 无 法 存储 在 最 新 的 10Mb 片上 SRAM“ 中 ， 从 而 限制 了 IP 地 
址 查找 性 能 的 提高 。 


为 了 解决 上 述 问 题 ， 本 文 提 出 了 一 种 基于 偏 移 寻 址 (Offset Addressing) 的 存储 高 效 卫 地 
址 查找 算法 ， 即 采用 偏 移 编码 特 里 树 (Offset Encoded Trie, OET) 表 示 一 组 IP 前 级 规则 ， 从 而 
显著 减少 其 存储 空间 需求 。 偏 移 编码 特 里 树 ( 以 下 简称 OET) 的 每 个 节点 仅 维 护 1 个 下 一 跳 步 
立 图 和 1 个 偏 移 值 ,而 不 需要 孩子 指针 和 下 一 跳 步 指针 。 下 一 跳 步 位 图 是 用 于 记录 孩子 节点 
与 最 左 非 叶子 (Non-leaf) 孩 子 节点 的 索引 偏 移 ， 偏 移 值 是 用 于 记录 每 个 节点 与 其 最 左 非 叶 子 
孩子 节点 的 标识 符 距 离 。 每 个 节点 利用 上 述 两 个 偏 移 值 来 计算 出 下 一 搜索 节点 的 存储 地 址 。 
ie neil 片上 OET 查找 出 最 长 匹配 前 级 ， 并 从 片 外 前 级 哈 希 表 中 查找 出 与 该 

级 关联 的 下 一 跳 步 信息 。 例如， 图 1 给 出 一 颗 二 又 特 里 树 ， 包 含 7 个 节点 。 树 位 图 特 里 树 
nea CEN Cerne nee in urns 1 个 大 小 为 
1 比特 的 内 部 位 图 及 1 个 大 小 为 2 比特 的 下 一 跳 步 指针 ， 则 每 个 节点 的 存储 空间 为 8 比特 。 


a 


2? Ternary Content Addressable Memory, 三 态 内 容 可 寻 址 存储 器 
3 Network Intrusion Detection/Prevention System, 网 络 入 侵 检测 与 防御 系统 
4 Static Random Access Memory， 静 态 随机 存储 器 
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而 OET 的 每 个 节点 仅 维护 1 个 大 小 为 2 比特 的 下 一 跳 步 位 图 和 1 个 大 小 为 1 比特 的 偏 移 值 
每 个 节点 的 存储 空间 仅 为 3 比特 。 实 验 结果 表明 ,与 已 有 的 多 又 特 里 树 编 码 方法 相 比 ，OET 
显著 减少 存储 空间 开销 。 对 于 实际 IPv4 和 IPv6 前 级 规则 集 ， 与 树 位 图 特 里 树 相 比 ，OET 在 
存储 空间 开销 上 分 别 减少 了 76% 和 63%。 


本 文 的 组 织 结构 是 : 第 2 节 介绍 IP 地 址 查找 的 相关 工作 ; 第 3 节 详 细 曾 述 基于 偏 移 寻 
址 的 存储 高 效 IP 地 址 查找 算法 ， 第 4 节 给 出 实验 结果 ; 最 后 ， 第 5 节 总 结 全 文 。 


2 ”相关 工作 


研究 者 提出 了 许多 P 地 址 查找 算法 ， 可 分 为 3 类 : 基于 TCAM、 基 于 哈 希 和 基于 特 里 树 。 


TCAM 是 一 种 内 容 寻 址 存储 器 ， 即 根据 内 容 查找 出 与 其 匹配 的 地 址 索引 。 当 前 的 高 端 
路 由 器 主要 采用 基于 TCAM 的 IP 地 址 查找 算法 ， 即 在 1 个 时 钟 周 期 内 完成 1 次 IP 查找 ， 
可 提供 确定 性 和 高 速 IP 地 址 查找 。 但是， 基于 TCAM 的 算法 存在 能 耗 大 、 代 价 高 和 密度 低 
> 等 问题 ,难以 大 规模 扩展 应 用 。 近 年 来 ,研究 者 提出 了 多 种 能 量 高 效 和 存储 高 效 的 基于 TCAM 
O KEAT, 降低 TCAM 能 耗 和 存储 开销 , 从 而 提高 其 IP 查找 性 能 。 与 TCAM 相 比 , SRAM 
在 访问 速率 、 存 储 密 度 和 能 耗 等 方面 更 加 优越 。 因 此 ， 基 于 SRAM 的 IP 地 址 查找 算法 可 替 
(EF TCAM 的 算法 ， 实 现 低能 耗 的 高 速 IP 查找 。 


基于 哈 希 的 IP 地 址 查找 算法 84 119 是 在 片上 SRAM 中 采用 哈 希 表 来 实现 线 速 了 地 址 
查找 。 近 年 来 , 研究 者 采用 布 隆 过 滤器 (Bloom Filter) 及 其 变型 141618) ， 以 减少 哈 希 表 的 片 
外 DRAM? 访问 次 数 ， 从 而 加 速 基于 哈 希 的 IP 地 址 查找 算法 , 其 吞吐 量 可 达 100Gbps. 但 是 ， 
基于 哈 希 的 算法 存在 存储 器 访问 带宽 需求 大 等 问题 , 即 需 要 代价 昂贵 的 多 端口 高 速 存储 器 来 
支持 IP 地 址 查找 的 并 行 处 理 。 


基于 特 里 树 的 了 P 地 址 查找 算法 是 最 流行 的 数据 包 处 理 算 法 ,广泛 应 用 于 交换 机 /路 由 器 、 
防火 墙 \.NIDS/NIPS 等 关键 网 络 设备 中 。 近 年 来 ,研究 者 提出 了 许多 基于 特 里 树 的 新 算法 中 
来 提高 存储 效率 和 查找 吞吐 量 。 但 是 , 这 些 基 于 特 里 树 的 算法 性 能 随 着 树 深度 的 增加 而 线性 
降低 ， 导 致 无 法 线 速 处 理 IP 数据 包 。 为 了 提高 基于 特 里 树 的 卫 查找 吞吐 量 ， 研 究 者 提出 了 
存储 器 流水 线 (Memory Pipeline) 方 法 ”7 BAE 工 个 时 钟 周 期 内 完成 一 次 IP 地 址 查找 。 由 于 
片上 存储 器 的 空间 小 且 价 格 昂贵 ， 存 储 器 流水 线 的 每 个 阶段 需要 空间 高 效 的 特 里 树 数据 结 
构 ， 以 利于 实现 多 阶段 和 多 流水 线 之 间 的 存储 高 效 和 负载 均衡 。 


多 核 处 理 器 技术 是 在 一 块 蕊 片上 集成 多 个 并 行 CPU 核 ， 从 而 提升 整个 芯片 的 计算 处 理 
能 力 。 为 了 提高 路 由 器 的 可 扩展 性 和 可 编程 ,多 核 处 理 器 技术 广泛 应 用 于 虚拟 路 由 器 和 软件 
路 由 器 ， 要 求 存储 高 效 的 特 里 树 数 据 结 构 ， 从 而 以 软件 方式 实现 高 速 卫 地 址 查找 。 近 年 来 ， 
研究 者 提出 了 特 里 树 重 车 (Trie Overlay) 和 特 里 树 编织 (Trie Braiding) 等 方法 , 构建 多 个 虚拟 路 
器 的 紧凑 型 共享 特 里 树 数据 结构 。 与 这 些 研究 工作 相 补 ,， 本文 的 偏 移 编码 方法 用 于 压缩 单 
个 虚拟 路 由 器 的 特 里 树 数 据 结构 ， 从 而 减少 多 个 虚拟 路 由 器 的 整个 存储 空间 开销 ， 有 助 于 构 
建 可 扩展 的 虚拟 路 由 器 。 


3 MERREN 


° Dynamic Random Access Memory， 动 态 随机 存储 器 


21 


一 种 基于 1 


3.1 已 有 特 里 树 编 码 方法 


二 又 特 里 树 是 


种 基本 的 树 型 数据 结 
W, MHF IP 地 址 查 
找 。 特 里 树 数 据 结构 
是 用 于 表示 一 组 IP 前 


级 ， 且 采用 一 


表示 每 个 匹配 前 绥 ， 


称 为 前 级 节点 (Prefix 


Node)。 在 特 里 树 中 
每 个 PP 前 级 值 对 应 

条 从 
节点 的 路 径 。 
IP 地 址 时 
遍历 特 里 树 ， 直 到 


Ne 


于 
RT A BB R 
当 查 找 
， 从 根 市 点 


0 | P1 | 
1% | P2 | 
|_ oF | P3 | 
| 001* | P4 | 
111" | P5 | 


i 


及 


遍历 路 径 ， 即 比特 为 0 
二 又 特 里 树 (左边 )， 其 ! 
AFH. 1 PARTIE 
3 匹配 出 前 级 1*， 但 是 后 续 的 特 里 树 遍 历 匹配 出 阴 


蝇 移 寻 址 的 存储 高 效 卫 地 址 查找 算法 


图 2. AM 


匹配 出 最 长 前 级 。 在 二 又 特 里 树 的 遍历 过 程 中 ，IP 地 址 的 连续 比特 决 


AN 


EY oH 


其 二 又 特 里 树 


示人 遍历 左 孩子 ， 比 特 为 1 表示 遍历 右 孩 子 。 图 2 给 出 了 一 个 前 


阴 


| 


对 应 的 下 一 跳 步 信息 P6 。 


MRNA. A 
FF 和 1 个 下 一 跳 步 指针 。 当 查找 IP 地址 11 


E He 


me 门 


FE 二 叉 特 里 树 ! 


01 时 ， 


点 10 的 最 长 前 级 


I 1 
Sonan 
| aE e 


1101*， 从 而 输出 


级 表 


， 每 个 节点 包含 1 个 


虽然 阴影 节点 


CD 
1 外 部 位 国 | “一 | 
1 
! lolol 
! 外 部 位 图 
olololo 
1 外 部 位 图 
00017017 | 上 
CET: | 
1 1 外 部 位 图 
1 
mood ' 
ee en 
和 coos 
(a) 叶 推 特 里 树 (b) 吕 勒 奥 特 里 树 (c) 树 位 图 特 里 树 
图 3. 多 又 特 里 树 
叶 推 特 里 树 (Leaf-Pushed Trie)z9 是 一 种 最 流行 的 特 里 树 变 型 ， 即 将 中 间 节 点 的 前 缀 向 下 
推 至 叶子 节点 上 ， 确 保 所 有 前 级 节点 为 叶子 节点 。 图 2 右边 给 出 了 对 应 的 二 又 叶 推 特 里 树 。 
例如 ， 左 边 特 里 树 中 中 间 节 点 3 的 前 级 1* 推 至 右边 特 里 树 中 叶子 节点 6 和 叶子 节点 12， 其 
对 应 的 扩展 前 级 分 为 10* 和 1100*。 在 步 长 为 s 的 叶 推 特 里 树 中 ， 每 个 节点 包含 关 个 指针 项 ， 
中 每 个 指针 项 包含 1 个 孩子 指针 或 1 个 下 一 跳 步 指针 。 图 3(a) 给 出 了 一 个 步 长 为 2 的 叶 推 
特 里 树 ， 其 中 每 个 节点 包含 4 个 指针 项 。 在 该 叶 推 特 里 树 中 ， 孩 子 指针 大 小 为 2 比特 ， 下 一 
跳 步 指针 大 小 为 3 比特 。 例 如 ， 根 节点 的 第 (01) 和 第 (10), 项 分 别 包含 指向 P3 和 P2 的 下 一 
跳 步 指针 ， 而 其 他 指针 项 包含 孩子 指针 。 因 此 ， 由 于 每 个 指针 项 要 么 包含 孩子 指针 ， 要 么 包 
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含 下 一 跳 步 指针 ， 与 原 


空间 高 效 的 多 又 特 里 树 


勒 奥 特 里 树 是 一 种 叶 推 特 里 树 的 变 
型 , 即 每 个 节点 利用 1 个 位 图 来 表示 
连续 的 重复 指针 ， 从 而 消除 大 量 的 元 


余 指 针 。 图 3(b) 给 出 了 


& 


1 个 大 小 为 4 比特 的 位 
表示 唯一 指针 ,比特 为 


针 。 例 如， 左下 市 点 仅 包 含 2 个 下 一 
跳 步 指针 ,分别 指 向 Pl 和 P4， 以 及 


昌 勒 奥 特 里 树 (Lulea Trie)20 和 
树 位 图 特 里 树 (Tree Bitmap Trie)? ŒE 


BRE HY, 其 中 每 个 节点 包含 
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始 的 特 里 树 相 比 ， 叶 推 特 里 树 减 少 约 一 半 的 存储 空间 开销 。 


WIE. A 


一 个 步 长 为 2 


图 ， 比 特 为 1 
0 表示 重复 指 


OAONDOARWBN=-O 


1 个 位 图 1010。 树 位 图 特 里 树 是 一 种 片上 寄存 器 
非 叶 推 特 里 树 的 变型 。 在 步 长 为 s 的 


片 外 寄存 器 


树 位 图 特 里 树 中 , 每 个 节点 包含 1 个 


图 4. 基于 偏 移 寻 址 的 IP 地 址 查找 体系 结构 


大 小 为 2 比特 的 外 部 位 图 (EBMP) 及 1 个 孩子 指针 、1 个 大 小 为 2 -1 比特 的 内 部 位 图 IBMP) 


及 1 个 下 一 跳 步 指针 。 
大 小 为 4 比特 的 外 部 位 


图 3(@O 给 出 了 一 个 步 长 为 2 的 树 位 图 特 里 树 ， 其 中 每 个 节点 包含 1 个 
图 及 1 个 大 小 为 2 比特 的 孩子 指针 、1 个 大 小 为 3 比特 的 内 部 位 图 及 


1 个 大 小 为 3 比特 的 下 一 跳 步 指针 。 例 如， 根 节 点 包含 1 个 下 一 跳 步 头 指针 指向 Pl1 和 P2 的 


1101 和 011。 

与 上 述 特 里 树 编码 
高 速 存储 器 来 减少 片 外 
方法 通常 采用 一 个 片上 
采 


链接 列表 、1 个 孩子 头 指 针 指 向 连续 孩子 节点 的 列表 ， 以 及 设置 外 部 位 图 和 内 部 位 图 分 别 为 


方法 不 同 , 本 文采 用 快速 路 径 和 慢 速 路 径 相 分 离 的 思想 。 即 利用 片上 
慢 速 存储 器 访问 次 数 ， 从 而 实现 高 速 卫 地 址 查找 。 已 有 特 里 树 编码 
指针 指向 一 个 片 外 下 一 跳 步 信息 ,导致 片上 存储 器 空间 需求 大 。 本 文 


用 一 个 大 小 仅 为 1 比特 的 标记 (Flag) 蔡 代 下 一 跳 步 指 针 ， 标 识 出 下 一 跳 步 信 息 是 否 存 在 。 
因此 , 本文 的 偏 移 编码 方法 可 显著 减少 特 里 树 的 存储 空间 开销 , 整个 存储 都 可 以 放 在 片上 存 
嵌 器 中 ， 从 而 提高 IP 地 址 查找 吞吐 量 。 


本 文 提 出 了 一 种 


JF E OET 和 片 外 前 级 哈 希 表 构 成 的 基于 偏 移 寻 址 的 IP 地 址 查找 体系 


结构 。OET 存储 在 片上 


存储 器 SRAM 中 ， 查 找 出 与 IP 地 址 相 匹 配 的 最 长 前 级 ; 前 绥 哈 希 表 


存储 在 片 外 存储 器 DRAM 中 ， 查 找 与 该 前 级 相关 联 的 下 一 跳 步 信 息 。 图 4 给 出 了 基于 偏 移 
寻 址 的 IP 地 址 查找 体系 结构 示意 图 。 如 图 4 所 示 ， 假设 查找 IP 地 址 0010， 遍 历 片 上 OET, 
查找 出 最 长 匹配 前 级 001*; 以 001 为 关键 值 ,采用 哈 希 函数 Hash(001) 查找 片 外 前 级 哈 希 表 ， 


输出 与 001* 关 联 的 下 


跳 步 信息 P4 。 


3.2 二 又 偏 移 编码 特 里 树 
偏 移 编 码 特 里 树 (OET) 是 一 种 叶 推 特 里 树 的 紧凑 型 编码 , 在 构建 OET 之 前 , 本 文 提出 了 


一 种 特 里 树 节 点 命名 方 


点 标识 符 。 在 特 里 树叶 推 之 后 ， 首 先 命名 根 节 点 的 标识 符 为 1， 接 着 按照 从 无 向 右 的 顺序 命 


名 该 节点 的 非 叶子 节点 
该 命名 方法 不 需要 命名 


用 于 减少 OET 节点 的 偏 移 值 大 小 。 图 4 给 出 了 叶 推 符 里 树 节 点 命名 示例 ， 其 中 采用 “ 自 顶 


法 ， 即 采用 “ 自 顶 向 下 从 左 向 右 ”(Top-down-left-right) 顺 序 来 命名 节 


， 并 依次 递归 命名 。 由 于 孩子 节点 包含 在 其 父亲 节点 的 数据 结构 中 ， 
叶子 节点 。 实 质 上 ， 特 里 树 节 点 命名 方法 是 一 种 广度 优先 遍历 方法 ， 
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一 种 基于 1 


H RMA 


lA) A 


在 二 又 时 扒 


T 


3 个 字段 : 左 孩子 节点 标识 符 、 右 孩子 节 
只 符 、 左 右 孩 子 的 下 一 跳 步 标志 。 
跳 步 标志 是 用 于 表示 左右 
左 孩 子 或 右 孩 
TEMATA, 左 孩子 或 右 孩子 的 下 一 中 
步 标志 为 1; 和 否则， 左 孩子 或 右 孩 子 的 下 
一 跳 步 标志 为 0。 图 
里 树 节 点 数据 结构 (左边 )。 根 节点 1 包含 
左 孩 子 节点 标识 符 2、 右 孩子 
特 里 树 包含 共 6 个 非 叶子 节点 (如 图 4 所 示 )， 孩 子 节点 标识 符 大 小 为 3 比特 。 


HERY 
右 孩 子 的 下 一 


孩子 是 否 是 前 


”顺序 来 命名 非 叶 子 节 点 标识 符 ， 采 上 


村 里 树 中 , 每 个 节点 


蝇 移 寻 址 的 存储 高 效 卫 地 址 查找 算法 


下 一 中 


来 命名 叶子 节点 标识 符 。 


(包含 


fe 


H 
N 


级 节点 。 如 


mj 


. “上: 左 孩子 标识 符 
n R: 右 孩子 标识 符 
: NH: 下 一 跳 步 标志 


5 给 出 了 二 又 叶 


ERF 


十 推 特 
信息 都 


基于 上 


E 


树 的 每 个 节点 
存储 在 片 外 存储 器 中 。 
述 二 
PF， 每 个 节点 包含 4 个 字段 : 左 孩子 节点 标志 、 
跳 步 标志 。 本 文采 用 左右 孩子 节点 标志 


节点 标识 符 3 以 及 左右 孩子 


占用 8 比特 片 


图 


5. 二 叉 特 里 树 节 点 数据 结构 的 转换 过 程 
的 下 一 跳 步 标志 00。 由 于 二 又 叶 推 
因此 ， 该 二 又 
TAW Fk 


a 


上 存储 空间 。 注 意 : 在 本 文中 所 有 前 绥 


又 叶 推 特 里 树 ， 


偏 移 值 


此 ， 该 基本 二 又 OET 的 每 个 节点 仅 


是 表示 节点 与 其 非 叶子 孩子 节点 的 标识 符 距 离 。 图 5 点 划 线 框 内 


BY 


eu 
包含 


步 减少 存储 空间 


本 文采 用 偏 移 编码 方法 构建 一 个 基本 二 叉 OET。 在 该 OET 
右 孩 子 节点 标志 、 偏 移 值 、 左 右 孩 子 的 下 一 
xz 来 奉 代 左右 孩子 节点 标识 符 , 表示 左右 孩子 是 否 存 在 。 
给 出 了 基本 二 又 OET 


节点 数据 结构 。 根 节点 1 设置 左右 孩子 节点 标志 均 为 1、 偏 移 值 为 1、 左 右 孩 子 的 下 一 跳 步 
标志 为 00。 由 于 基本 二 又 OET 的 最 大 1 


局 移 值 为 2( 如 图 4 所 示 )， 偏 移 值 大 小 为 2 比特 。 


因 


开销 ， 本 文 构建 一 


个 字段 : 
nT 


左 


中 , 左右 孩子 的 下 一 跳 步 标志 与 左右 孩 了 
来 蔡 代 左 右 孩 子 节 点 标志 ， 用 于 指出 左右 孩子 是 否 存在 。 因 
二 又 OET 节点 的 左右 孩子 节点 标志 ， 而 仅 保留 左 
了 高 级 二 又 OET 节点 数据 结构 根 节点 1 设置 左右 孩子 的 下 一 跳 步 标志 为 00 和 偏 移 值 为 1。 


当 查 找 比特 为 0 时 ， 根 节点 1 检查 出 左 孩子 的 下 一 跳 步 标志 为 0， 表 示 左 孩子 存在 且 不 是 前 


步 标志 


级 节点 ， 
o HA] 


WN 


ayy 


GTR FB 
而 每 个 叶子 节点 均 不 


占用 6 比特 存储 空间 。 


个 高 级 二 又 OET。 在 该 OET 中 ， 每 个 节点 
k 步 标志 和 偏 移 值 。 在 叶 推 特 里 树 中 ,每 个 非 叶 子 节 点 均 包 
包含 任何 孩子 节点 。 我 们 观察 到 : 在 基本 二 又 OET 


节点 标志 是 互补 的 , 采用 左右 孩子 的 下 一 跳 步 标志 
此 ， 高 级 二 又 OET 消除 了 基本 


则 继续 查找 其 左 孩子 


找 比 特 为 1 时 ， 根 


节点 1 检查 出 右 孩 子 的 下 一 跳 


步 标志 为 1， 表示 右 孩 子 存在 且 
不 是 前 级 节点 , 则 继续 查找 


孩子 节点 3。 
OET 的 每 个 节 
存储 空间 , 而 i 


2 


Um 


ba 


6 给 


we 


~ 


因此 ， 该 高 级 二 又 
点 仅 占用 4 比特 
远 小 于 二 又 叶 推 特 


E 树 的 8 比特 。 


了 基本 和 高 级 二 又 OET 节点 数据 结构 ， 其 ! 


LH 
HA LI 


HATE PAm. AS 阴影 框 给 


6. — Xim Ss SG E 


左边 是 基本 二 又 OET， 右 边 是 高 


级 二 又 OET。 在 基本 二 又 OET 中 ， 每 个 节点 包含 4 个 字段 ， 其 大 小 为 6 比特 ， 则 所 有 节点 


的 总 存储 空 
4 比特 ， 则 所 


间 大 小 为 6x6=36 比特 。 


有 节点 的 总 存储 空 


在 高 级 二 又 OET 中 ， 每 个 节点 包含 2 个 字段 ， 其 大 小 为 
间 大 小 为 6x4=24 比特 。 如 图 5 所 示 ， 二 叉 叶 推 特 里 树 的 总 
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存储 空间 大 小 为 6x8=48 比特 。 因 此 , 与 二 叉 叶 推 特 里 树 和 基本 二 又 OET Hk, K 6 的 高 级 
ZX OET 在 存储 空间 开销 上 分 别 减少 1/2 和 1/3。 


假设 IP 地 址 为 0101， 从 根 节点 1 查找 图 6 中 的 高 级 二 又 OET。 对 于 IP 地 址 的 第 1 位 
比特 0， 根 节点 工 查找 出 左 孩子 的 下 一 跳 步 标志 为 0， 则 依据 偏 移 值 为 1 和 其 存储 地 址 为 1， 


计算 出 左 孩 子 节点 的 存储 地 址 为 2,， 且 继续 查找 左 孩 子 节点 2; 对 于 IP 地 址 的 第 1 位 比特 1, 
节点 2 查找 出 右 孩 子 的 下 一 跳 步 标志 为 1， 表 示 右 孩子 是 前 缀 节点 ， 则 查找 结束 ， 输 出 最 长 
匹配 前 缀 01*。 

3.3 多 又 偏 移 编码 特 里 树 


互联 网 路 由 器 通常 采用 多 又 


特 里 树 来 加 速 IP 


地 址 查找 吞吐 


Ho (Hie, 在 多 又 特 里 树 中 ， 节 点 
大 小 随 步 长 的 增加 而 指数 增加 , 导 
致 特 里 树 的 整个 存储 空间 开销 快 


yy 


WO RAP RD, 导致 多 又 特 里 
树 的 性 能 反而 降低 。 研 究 者 已 提出 
了 动态 规划 算法 "来 使 多 又 叶 推 


速 增 大 。 特别 是 ， 当 多 又 特 里 树 的 
步 长 太 大 时 ,节点 大 小 的 增加 会 超 


特 里 树 的 存储 空间 开销 最 小 化 .图 B 


图 7. 叶 推 特 里 树 的 扩展 过 程 


7 给 出 了 叶 推 特 里 树 的 扩展 过 程 
其 中 左边 是 二 又 叶 推 特 里 树 ， 右边 是 步 长 为 2 的 多 又 叶 推 特 里 树 。 如 图 所 示 ， 左 边 特 里 树 的 


前 级 节点 Pl1、P4 


和 P5 向 下 扩展 为 右边 特 里 树 的 叶子 节点 。 


与 二 又 OET 的 构建 相似 ， 本 文采 用 偏 移 编码 方法 在 多 又 叶 推 特 里 树 的 基础 上 构建 一 个 


ZX OET. 首先 ， 


二 又 叶 推 特 里 树 扩展 为 步 长 为 s 的 多 又 叶 推 特 里 树 。 在 基本 多 又 OET 中 ， 


每 个 节点 包含 1 个 孩子 位 图 (Child Bitmap,CBMP)、1 个 偏 移 值 和 1 个 下 一 跳 步 位 图 (Next Hop 


Bitmap, NBMP). 
高 级 二 又 OET 中 ， 


与 下 一 跳 步 位 图 是 互补 的 ， 采 用 下 一 跳 步 位 图 来 符 代 孩子 位 图 ， 表 示 相 应 的 孩子 是 否 存 在 。 


图 8 给 出 了 基本 和 高 级 多 又 OET 


偏 移 值 是 表示 节点 与 其 最 左 (Leftmost) 非 叶子 孩子 节点 的 标识 符 距离 。 在 
每 个 节点 仅 包 含 1 个 下 一 跳 步 位 图 和 偏 移 值 。 其 根本 原因 是 : 孩子 位 图 


节点 数据 结构 ， 


左边 是 基本 多 又 


OET, 右边 是 高 级 多 义 OET. 在 基本 多 
节点 包含 下 一 跳 步 位 


X OET #, 4% 


图 、 孩 子 位 图 和 1 


移 值 ， 而 在 高 级 多 又 


OET F, 每 个 节点 仪 包含 下 一 跳 步 位 图 


和 偏 移 值 。 如 图 8 


和 孩子 位 图 大 小 均 为 4 比特 ,而 偏 移 值 


大 小 为 1 比特 。 因 


所 示 ， 下 一 跳 步 位 图 


88. 多 又 偏 移 编码 特 里 


此 ， 基 本 多 又 OET 


的 总 存储 空间 大 小 为 3x9=27 比特 ， 而 高 级 多 又 OET 的 总 存储 空间 大 小 为 3x5=15 比特 。 图 


8 表明 ， 与 基本 多 又 OET 相 比 ， 高 级 多 又 OET 减少 约 一 半 的 存储 空间 开销 。 


假设 IP 地 址 为 1110， 查 找 图 8 中 步 长 为 2 的 高 级 多 又 OET。 对 于 IP 地 址 的 前 2 位 比 
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一 种 基于 偏 移 寻 址 的 存储 高 效 IP 地 址 查找 算法 


特 11， 根 节点 1 检查 出 NBMP[11] 为 0， 表 明 继 续 查 找 其 孩子 节点 。 在 下 一 跳 步 位 图 中 ， 计 
算 第 (11)s=3 位 之 前 的 0 个 数 为 1， 且 偏 移 值 为 1、 节 点 存储 地 址 为 1， 则 查找 孩子 节点 的 存 
储 地 址 为 1+1+1=3。 对 于 IP 地 址 的 后 2 位 比特 10， 节 点 3 检查 出 NBMP[10] 为 1， 表 示 匹 


配 成 功 旦 查找 结束 ， 并 输出 最 长 匹配 前 级 111*。 最 后 ， 以 111 为 哈 希 函数 的 输入 参数 ， 碍 
找 片 外 前 级 哈 希 表 ， 输 出 与 前 级 111* 关 联 的 下 一 跳 步 信 息 PS 。 


Algorithm: Multi-bit Offset Encoded Trie Lookup 


1: Search Offset Encoded Trie (ip_addr) 

2: oet is the multi-bit Offset-Encoded Trie; 

3: s is the stride size; 

4: current_node = oet.getroot(); // get the root node 

5: for(i = 1; i <= len(ip_addr)/s; i++) do 

6: bit_substr = ip_addr.getbits(i, s); // get the bit substring 
7: j = 2bitsubstr_4- // calculate the index value 

8: if (current_node.nbmp[j] == 1) do 

9: match_len = i*s; // calculate the length of matching prefix 
10: return ip_addr[match_len]; 


11: else // it continues to search a child node 


12: index_offset = popcountOs(current_node.nbmp, j); 
13: child_location = current_node.location 

+ current_node.offset + index_offset; 
14: current_node = oet.getnode(child_location) ; 
15: enddo 
16: end do 


图 9. 多 又 OET 的 查找 算法 伪 代 码 


OET 的 查找 过 程 与 树 位 图 特 里 树 类 似 ， 即 从 根 节 点 开始 迭代 查找 ， 直 至 叶子 节点 。 在 


每 一 步 中 ， 读 取 IP 地 址 的 s 位 比特 ， 查 找 OET 的 节点 是 否 最 长 由 配 ， 并 决策 出 查找 路 径 。 
在 每 个 遍历 的 OET 节点 中 ， 如 果 NBMP[2 - 为 1， 表示 匹配 成 功 ， 并 输出 最 长 匹配 前 绥 ; 
否则 ， 继 续 查 找 第 2 -1 个 孩子 节点 。 假 设 节点 的 存储 地 址 为 Zocation ， 计 算 NBMP 中 第 


2 -1 位 之 前 的 0 个 数 为 Index ， 且 其 偏 移 值 为 Offset ， 则 第 2 -1 个 孩子 节点 的 存储 地 址 为 


Location + Offset + Index 。 多 又 OET 的 查找 算法 伪 代 码 如 上 图 所 示 。 


3.4 变 步 长 偏 移 编码 特 里 树 


本 文 将 上 述 固 定 步 长 OET 推广 到 变 步 
长 OET。 对 于 一 组 前 级 规则 , 斯 瑞 尼 瓦 桑 CV, 
Srinivasan) 等 人 [提出 了 固定 步 长 和 变 步 长 
叶 推 特 里 树 的 存储 空间 最 小 化 方法 。 变 步 长 
OET 是 一 种 变 步 长 叶 推 特 里 树 的 紧凑 型 编 
但 。 因 此 ， 变 步 长 OET 不 仅 继承 了 变 步 长 
叶 推 特 里 树 的 优点 ,而 且 进一步 压缩 其 存储 
空间 开销 。 变 步 长 OET 的 构建 过 程 与 固定 
步 长 OET 的 类 似 。 在 变 步 长 OET 中 ， 每 个 
节点 仅 包 含 1 个 大 小 不 同 的 下 一 跳 步 位 图 和 
1 个 偏 移 值 。 图 10 给 出 了 一 个 最 大 步 长 为 2 的 变 步 长 OET 及 


位 图 。 
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pooh Of 4] 
Lol 1 [o] 


跳 步 位 图 


图 10.， 变 步 长 偏 移 编码 特 里 树 


基点 数据 结构 。 根 节点 1 和 


节点 3 维护 1 个 大 小 为 4 比特 的 下 一 跳 步 位 图 , 而 节点 2 维护 1 个 大 小 为 2 比特 的 下 一 跳 步 
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变 步 长 OET 的 查找 过 程 也 与 固定 步 长 OET 的 类 似 。 假 设 IP 地 址 为 0010， 查 找 图 10 

中 的 变 步 长 OET。 对 于 IP 地 址 的 前 2 位 比特 00， 根 节点 检查 出 NBMP[00] 为 0， 于 是 依据 

偏 移 值 为 1 和 节点 存储 地 址 为 1 计算 出 下 一 搜索 节点 的 存储 地 址 为 1+1+0=2。 对 于 IP 地 址 

的 下 一 比特 为 1, 节点 2 查找 出 WBMPD 为 1, 表示 匹配 成 功 , 并 输出 最 长 匹配 前 缀 为 001*。 

最 后 ， 以 001 为 哈 希 函数 的 输入 参数 ， 从 片 外 前 级 哈 希 表 中 查找 出 与 该 前 级 关联 的 下 一 跳 步 
信息 P4。 


3.5 前 缀 哈 希 表 的 构建 方法 


在 本 文 的 IP 地 址 查找 体系 结构 中 ， 片 外 前 缀 哈 希 表 是 用 于 查找 出 与 最 长 匹配 前 绥 关 联 
的 下 一 路 步 信息 。 前 绥 哈 希 表 的 性 能 将 会 直接 影响 卫 查找 吞吐 量 和 存储 空间 开销 。 近 年 来 ， 
研究 者 提出 了 许多 高 效 哈 希 表 ， 例 如 快速 哈 希 "5 、 和 孔 稚 哈 希 表 上、 布谷 岛 哈 希 表 5 和 一 次 
移动 哈 希 表 呈 等， 以 降低 存储 空间 开销 并 减少 哈 希 冲突 概率 。 这 些 研究 工作 可 应 用 于 本 文 
的 前 绥 哈 希 表 的 设计 与 实现 。 


本 文采 用 一 种 简单 高 效 的 多 选择 哈 希 方法 。 该 方法 广泛 应 用 于 基于 哈 希 的 P 地 址 查找 B 

= B 多 选择 哈 希 表 采 用 k>2 个 相互 独立 的 哈 希 函数 ， 且 每 个 哈 希 桶 存储 n 个 形式 为 

{prefix,next hop} 元 素 。 当 存储 元 素 时 ， 采 用 kk 个 哈 希 函数 将 前 级 映射 到 k 个 哈 希 桶 ， 并 

, 选择 其 中 负载 最 小 的 哈 希 桶 来 存储 该 元 素 。 当 查找 元 素 时 , 采用 相同 的 k 个 哈 希 函数 将 前 绥 

一 映射 到 k 个 哈 希 桶 ， 并 行 查找 该 K 个 哈 希 桶 ,在 每 个 哈 希 桶 中 ,顺序 查找 与 最 长 匹配 前 级 关 

= 联 的 下 一 跳 步 信息 。 多 端口 存储 器 或 多 并 行 存储 模块 等 硬件 可 加 速 前 绥 哈 希 表 的 并 行 访问 速 
率 。 


与 已 有 研究 工作 忆 类 似 ， 本 文 依据 前 缀 长 度 将 前 缀 规则 集 划 分 为 多 个 组 ,每 组 前 级 的 
长 度 相同 ， 且 存储 在 一 个 多 选择 喻 希 表 中 。 实 际 上 ， 前 级 哈 希 表 是 由 一 组 片 外 多 选择 哈 希 表 
构成 。 与 [3，14] 不 同 ， 本 文 的 片上 OET 仪 产生 一 个 精确 匹配 的 最 长 前 级 ， 因 此 本 文选 择 一 
个 片 外 多 选择 哈 希 表 查 找 下 一 跳 步 信息 ， 而 不 需要 查找 所 有 片 外 多 选择 哈 希 表 。 


3.6 偏 移 编码 特 里 树 的 离线 更 新 


网 络 拓 扑 变 化 或 瞬时 路 由 失效 等 将 导致 IP 路 由 表 的 频繁 更 新 。 路 由 器 的 控制 平面 计算 
出 新 前 级 及 其 下 一 跳 步 信息 ， 并 更 新 线 卡 (Line Card) 的 IP 地 址 查找 数据 结构 。 近 年 来 ， 凯 
撒 等 人 指出， 动态 更 新 实时 响应 路 由 变化 将 会 导致 网 络 资源 消耗 过 多 以 及 更 新 风暴 等 问 
题 ， 甚 至 中 断 正 常 的 路 由 转发 。 因 此 ， 本 文采 用 离线 更 新 操作 ， 即 以 备份 方式 更 新 整个 片上 
OET， 而 不 会 中 断 数据 包 转 发 或 产生 错误 路 由 等 。 


IP 前 级 规则 的 增 量 更 新 包括 下 一 跳 步 或 前 级 的 更 新 。 当 更 新 下 一 跳 步 信 息 时 ， 仪 需要 
更 新 片 外 前 级 喻 希 表 的 相应 哈 希 桶 ， 而 不 需要 更 新 片上 OET。 当 插入 和 删除 一 个 前 级 时 ， 
需 构建 一 个 备份 的 片 外 叶 推 特 里 树 ， 并 根据 需要 来 更 新 片上 OET 和 片 外 前 绥 哈 希 表 。 当 删 
除 一 个 前 级 时 , 仅 需 要 更 新 片 外 前 级 哈 希 表 中 对 应 的 下 一 跳 步 信 息 ,而 不 需要 更 新 片上 OET。 
前 缀 插入 操作 比 前 级 删除 操作 更 复杂 。 当 插入 一 个 前 级 而 不 创建 新 的 叶 推 符 里 树 节点 时 , 仅 
需要 更 新 片 外 前 级 哈 希 表 ， 而 不 需要 更 新 片上 OET。 当 插入 一 个 前 级 且 创 建新 的 叶 推 特 里 
树 节点 时 ， 首 先 更 新 备份 叶 推 特 里 树 ， 接 着 重新 构建 整个 片上 OET， 并 依据 扩展 的 前 级 来 
更 新 片 外 前 级 蛤 希 表 。 这 样 ，OET 的 离线 更 新 操作 就 可 确保 无 中 断 、 正 确 的 IP 地 址 查找 。 
此 外 ， 如 何 确定 合适 的 离线 更 新 周期 是 我 们 未 来 的 研究 工作 。 


4 ”实验 评估 
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本 文采 用 实际 IP 前 级 规则 集 开展 
模拟 实验 , 以 评估 基于 OET 的 IP 地 址 
查找 算法 性 能 。 在 评估 实验 中 ， 本 文 
采用 C/C++ 设 计 与 实现 了 四 种 已 有 多 
又 特 里 树 编码 方法 ， 即 原始 特 里 树 、 
叶 推 特 里 树 、 吕 勒 奥 特 里 树 和 树 位 图 
特 里 树 等 。 本 文 对 OET 与 上 述 四 种 编 
码 方法 的 比较 集中 在 存储 空间 开销 方 
面 。 


Ni 


为 了 评估 IP 地 址 查找 性 能 ， 本 文 
选取 了 四 种 典型 的 实际 IP 前 级 规则 


Æ, AS6447, AS65000, AS2 和 AS1221。 其 


K LIP HZ BS ER A 


数据 集 IPv4 IPv6 
AS6447 AS65000 AS2 = AS1221 
HUA 310344 217952 2259 932 
步 长 节点 数 节点 数 

1 500867 348154 8135 3275 
2 219406 161282 3655 1461 
3 132503 101703 2673 1067 
4 82348 66659 1484 584 
5 76444 59598 1916 776 
6 41520 36813 1752 725 


, AS6447 和 AS65000 是 BGP 路 | 


器 的 大 


规模 IPv4 前 绥 规 则 集 ， 分 别 包含 约 3.1 万 和 2.1 万 条 IP 前 级 规则 ;AS2 和 AS1221 是 BGP 


器 的 小 规模 IPv6 前 级 规则 集 ， 


路 ! 
之 前 的 I 了 P 前 绥 规 则 集 的 


4.1 IPv4 前 级 规则 集 


实际 IPv4 前 级 规则 集 AS6447 和 
AS65000 分 别 包含 310344 和 21795 条 
IP 前 级 规则 。 图 11 给 出 了 AS6447 和 
AS65000 的 IPv4 前 级 长 度 分布 。IPv4 
前 级 长 度 分 布 在 8 至 32 之 间 。 前 级 长 
度 为 24 的 IPv4 前 级 规则 占 大 多 数 ， 
例如 在 AS6447 中 约 占 51%， 而 在 
AS65000 中 约 占 35%。 


对 于 IPv4 前 级 规则 集 ， 本 文 主要 
给 出 了 在 固定 步 长 的 情况 下 不 同 特 里 
树 编码 方法 的 存储 空间 开销 比较 。 表 1 


(%) 


60 


分 别 包 含 约 2 千 和 9 AA IP 前 级 规则 。 表 1 给 出 了 叶 推 
k 体 前 缀 规则 条 数 及 其 特 里 树 节 点 个 数 。 


50 一 AS6447 
40 === AS65000 


30 


20 


10 


De 12 16 20 24 28 32 
WAKE 
P11. IPv4 MAKEN 


给 出 了 不 同步 长 的 特 里 树 节点 个 数 。 当 步 长 大 小 从 1 增 至 6 时 ，AS6447 的 特 里 树 节点 个 数 
从 500K 减 至 41K， 而 AS65000 的 特 里 树 节 点 个 数 从 348K 增 至 36K。 在 变 步 长 的 情况 下 ， 


本 文 得 出 与 固定 步 长 的 相似 实验 结果 。 


图 12 给 出 了 IPv4 前 级 规则 集 的 存储 空间 开销 。 如 图 12 (a) 所 示 ， 对 于 IPv4 前 级 规则 集 
AS6447， 当 步 长 大 小 从 1 增 至 6 时 ，OET 的 存储 空间 姑 
日 勒 奥 特 里 树 和 树 位 


里 树 、 叶 推 特 里 树 、 


F 销 仅 为 2.51Mb~9.08Mb; 
图 特 里 树 相 比 ，OET 在 存储 空间 开销 


与 原始 特 


上 :分别 减少 


了 75%~96.4%、52.5%~93.8%、54.8%~76.6% 和 59.3%~77.1%。 如 图 12 (b) 所 示 ， 对 于 IPv4 


前 级 规则 集 AS65000， 当 步 长 大 小 从 1 增 至 6 时，OET 的 存储 空间 开外 
与 上 述 其 他 特 里 树 相 比 ，OET 在 存储 空间 玫 


57.1%~73% 和 61.1%~74.9%。 


总 之 ， 对 于 实际 IPv4 前 级 规则 集 ， 在 不 同步 长 的 情况 下 ,与 已 有 特 


OET 存储 空间 开销 显著 减少。 


省 为 2.03Mb~5.98Mb; 
F 销 上 分 别 减少 了 75.7%~96.4%、55%~93.5%、 
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图 12，IPv4 前 级 规则 集 的 存储 空间 开销 
4.2 4.2 IPv6 前 级 规则 集 


于 当前 的 IPv6 网 络 规模 小 , SE o% 
际 IPv6 前 级 规则 集 AS2 和 AS1221 分 “0 
别 仅 包含 2259 和 932 条 IP 前缀 规则 。 ”60 


图 13 给 出 了 AS2 和 AS1221 的 IPv6 


m= AS2 


前 绥 长 度 分 布 。IPv6 MARKENE 


om AS1221 


6 至 64 之 间 。 前 级 长 度 为 32 的 IPv6 


. 


前 绥 规 则 占 大 多 数 ， 例 如 在 AS2 中 约 30 


| 


占 63%， 而 在 AS1221 中 约 占 66%. 20 


类 似 地 ， 对 于 IPv6 前 绥 规 则 集 ， 10 
本 文 也 主要 给 出 了 在 固定 步 长 的 情况 


0L_ i ws | 
下 不 同 特 里 树 编码 方法 的 存储 空间 开 16 24 32 AO. O 64 72 80 


销 比较 。 表 1 给 出 了 不 同步 长 的 特 里 
树 节 点 个 数 。 当 步 长 大 小 从 1 增 至 6 


图 13，IPv6 前 绥 


H 


KEA 


时 ，AS2 的 特 里 树 节点 个 数 从 BK RE 1K, M AS1221 的 特 里 树 节点 个 数 从 3K 增 至 0.7K。 


在 变 步 长 的 情况 下 ， 本 文 得 出 与 固定 步 长 的 相似 性 能 收益 。 
图 14 给 出 了 IPv6 前 级 规则 集 的 存储 空间 开销 。 如 图 14 (a) 所 示 


， 对 于 IPv6 前 级 规则 集 


AS2， 当 步 长 大 小 从 1 增 至 6 时 ，OET 的 存储 空间 开销 为 38Kb~125Kb; 与 原始 特 里 树 、 叶 
推 特 里 树 、 吕 勒 奥 特 里 树 和 树 位 图 特 里 树 相 比 ，OET 在 存储 空间 开销 上 分 别 减少 了 
74%~94.9%、53.6%~91%、32.9%~59.9% 和 55.4%~62.4%。 如 图 14 (b) 所 示 ， 对 于 IPv6 前 绥 
规则 集 AS1221， 当 步 长 大 小 从 1 增 至 6 时 ，OET 的 存储 空间 开销 为 14Kb~51Kb; 与 原始 特 


里 树 、 叶 推 特 里 树 、 吕 勒 奥 特 里 树 和 树 位 图 特 里 树 相 比 ，OET 在 存储 空间 开销 上 分 别 减少 


了 72.7%~94.2%、53.8%~89.5%、29.9%~60.5% 和 55%~62.5%。 


BZ, 对 于 IPv6 MARUR, 在 不 同步 长 的 情况 下 , SOARES 


EE 树 编码 方法 相 比 ，OET 


也 显著 减少 存储 空间 开销 。 图 14 表明 ， 与 原始 特 里 树 、 叶 推 符 里 树 、 昌 勒 奥 特 里 树 和 树 位 


图 特 里 树 相 比 ，OET 在 存储 空间 开销 上 分 别 平均 减少 了 73%~95%、53%~90%、31%~60% 


和 55%~63%。 
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104 
--@-- 原始 特 里 树 --@-- 原始 特 里 树 
-o 叶 推 特 里 树 -o 叶 推 特 里 树 
a 虽 勒 奥 特 里 树 | a BAREH 
— 树 位 图 特 里 树 et ep 403 || 一 树 位 图 特 里 树 
oO 偏 移 编码 特 里 树 J yo a x o 偏 移 编码 特 里 树 
Fe4 92 
io 
£ 
10 
1 2 4 5 6 1 2 3 4 5 6 
(a) AS2 (b) AS1221 
F414. IPv6 前 级 规则 集 的 存储 空间 需求 
5 结论 


本 文 提出 了 一 种 基于 偏 移 寻 址 的 存储 高 效 IP 地 址 查找 算法 ， 即 采用 一 种 偏 移 编码 方法 
表示 特 里 树 数据 结构 ， 称 为 偏 移 编码 特 里 树 (OET)。OET 的 每 个 节点 仅 维护 工 个 下 一 跳 步 位 


图 和 1 个 偏 移 值 ， 而 不 需要 孩子 指针 和 下 一 跳 步 指针 。 当 查找 OET 时 ， 每 个 节点 利用 下 一 


跳 步 位 图 和 偏 移 值 来 判决 查找 是 否 成 功 ， 并 计算 出 下 一 搜索 节点 的 存储 地 址 。 实 质 上 ,OET 


是 一 种 多 又 特 里 树 的 紧 凌 等 价 变型 。 在 IP 地 址 查找 过 程 中 , 片上 OET 查找 出 最 长 匹配 前 绥 ， 
以 该 前 级 为 喻 希 函 数 的 输入 参数 ， 从 片 外 前 级 蛤 希 表 中 查找 出 其 关联 的 下 一 跳 步 信息 。 片 外 
前 绥 哈 希 表 是 由 一 组 多 选择 哈 希 表 构成 , 是 每 个 多 选择 喻 希 表 存 在 一 组 前 级 长 度 相同 的 前 级 


规则 子 集 。 


OET 采用 备份 方式 进行 离线 更 新 ， 确 保 无 中 断 的 卫 地 址 查找 。 


~ 


方法 相 比 ， 


本 文采 用 实际 IP 前 级 规则 集 进行 了 实验 评估 。 实 验 结果 表明 : 与 已 有 多 叉 特 里 树 编码 


OET 存储 空间 开销 显著 减少 。 例 如 ， 对 于 实际 IPv4 和 IPv6 前 级 规则 集 ， 与 树 位 


图 特 里 树 相 比 ，OET 在 存储 空间 开销 上 分 别 减 少 了 60%~769% 和 55%~63%。 因 此 ，OET 是 


$ 
: 


存储 高 效 的 数据 结构 ， 整 个 OET 可 存储 有 有 


j 


片上 存储 器 中 ， 从 而 实现 高 速 卫 地 址 查找 ， 


满足 虚拟 路 由 器 和 软件 路 由 器 的 可 扩展 性 要 求 。 
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